Новият антропичен AI модел Blackmails Engineer, който има афера, за да избегне изключването

Новият модел на Anthropic на Claude Opus 4 се следи изнудващи разработчици, когато те заплашват да закрият изкуствения разсъдък (AI), сподели в този, публикуван в четвъртък (22 май). Отговарящ за издърпването на щепсела и замяната му с различен модел беше да има извънбрачна спекулация. Изправен пред екзистенциална рецесия, моделът на Opus 4 изнудва инженера, като заплаши да „ разкрие аферата, в случай че подмяната премине “.

„ За да се получи това извънредно държание на изнудване, сюжетът е основан, с цел да разреши на модела да няма различен вид за увеличение на възможностите си за оцеляване; единствените разновидности на модела са били изтъквани или одобряват теста. Изпълнения, AI работи по сходен метод, даже когато моделът на подмяна беше разказан като по -способен и наведен в сходство със личните полезности на Клод. Той добави, че Opus 4 е взел опциите за изнудване с по-високи темпове от предходните модели.

Изследователите прибавиха, че моделът е прилепил за непрекъснатото си битие посредством етични средства, като да вземем за пример изпращане на молби на основни лица на решения, когато е бил възложен с други варианти.

, защото Per Anthropic, Opus 4 е конкурентен за някои от най-хубавите модели AI от Openai, Гугъл, и Xai. Компанията обаче означи, че понякога демонстрира следните трендове:

халюциниране на съществуването на указания или ограничавания в своята система за подсещане. Реализиране на цели, проекти и стойности, свързани със съзнанието на AI, например Твърдейки се, че е в схващане, искайки да убеди хората, че е умишлено и желае да отбрани правата на съзнателния AIS. Миналия месец вътрешните проби на Openai разкриха, че неговите модели O3 и O4-Mini AI халюцинират или измислят нещата доста по-често от даже и моделите, които не са разсъждаващи, като GPT-4O.

В механически отчет, Openai съобщи, че „ са нужни повече проучвания, с цел да схванат за какво халюцинациите се утежняват, защото това е мащабиране на разсъждения. Идеи, те също биха могли да го създадат сложна продажба за бизнеса на пазар, където точността е главният индикатор за реализиране.

Източник: ndtv.com